Loading...
机构名称:
¥ 1.0

摘要。自动驾驶(AD)的数据驱动方法在过去十年中已被广泛采用,但面临着数据集偏见和无法解释性。受到人类驾驶的知识驱动性质的启发,最近的方法探讨了大型语言模型(LLMS)的潜力,以改善交通情况中的理解和决策。他们发现,使用经过三通链(COT)推理过程的下游数据上LLM的预处理范式可以增强可解释性和场景的理解。,这种流行的策略被证明遭受了臭名昭著的概率,而精制的婴儿床与随之而来的决策不符,而这种决策仍未受到以前基于LLM的AD方法的影响。为了解决这个问题,我们激励了基于多模式的LLM的端到端决策模型,该模型同时执行COT推理并执行计划结果。fur-hoverore,我们提出了配对的婴儿床和计划结果之间的推理决策对准约束,并在推理和决策之间施加了对应关系。此外,我们重新设计了COTS,以使模型能够理解复杂的方案并增强决策绩效。我们将建议的大型语言规划师与推理决策对齐为RDA驱动器。对Nuscenes和Drivelm-Nuscenes基准的实验评估证明了我们的RDA驱动器在增强最终AD系统性能方面的有效性。具体来说,我们的RDA驱动程序在Nuscenes数据集上实现了最先进的计划性能,具有0.80 L2误差和0.32的碰撞率,并且在挑战Drivelm-nuscenes基准方面取得了领先的结果,具有0.82 L2 L2误差和0.38碰撞率。

arxiv:2408.13890v1 [cs.cv] 2024年8月25日

arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第1页

arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第2页

arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第3页

arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第4页

arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第5页